Political Sentiment Analysis

我們分析了著名的民主黨與共和黨政治人物的twitter資料

EXISTING DATASET

KAGGLE: Hillary Clinton Barack Obama

EXTRACTION

PYTHON, PANDAS: Tweet + Attributes

PROCESSING

NLTK, TEXTBLOB, VADER: Sentiment Scores Calculated

VISUALIZATION

MATPLOTLIB, PLOTLY: Charts, Interactive Plots

每日平均推特發言次數

我們計算美國政治人物在Twitter發文次數並且製作圖表比較
















很明顯的,川普的推特使用率真的高出其他政治人物很多!

文字情緒比較

我們將三位政治人物的Twitter言論進行情感分析,並分成三類
我們使用Microsoft Textblob進行sentiment analysis
Polarity 代表情感極性,取值範圍是 [-1, 1],-1 代表完全負面,1 代表完全正面
Subjectivity 代表主觀性程度。

我們情緒分析的算法為:
Polarity >= 0.1 是 正面的
Polarity <= -0.1 是 負面的
其餘為中立

Calculated using a Lexicon to assign scores to n-grams and find Polarity and Subjectivity scores for a given string.
Team Image

Donald Trump

Team Image

Barack Obama

Team Image

Hillary Clinton





川普對敵人的態度—以歐巴馬及希拉蕊為例

會舉這兩人為例是因為一個是前任總統,一個則是2016年總統大選時的競爭對手。下圖是川普對兩人的推特貼文數隨時間的變化圖。藍色線是歐巴馬,橘色線則是希拉蕊。可以看到高峰分別是2012年歐巴馬的八百多則貼文,以及2016年時希拉蕊的五百多則貼文。有趣的是川普明明2012年沒有參選總統,2012年歐巴馬的貼文甚至比2016年希拉蕊的貼文還要多。我們推測這是基於川普對於黑人參政的厭惡,而這可能也是他在2016年參選總統的契機。










接著看下去,歐巴馬的貼文逐年變少,甚至在2015-2016的總統大選期間達到底部,反倒是希拉蕊的貼文從2014年的個位數則,2015年的百位數則,一直到2016年的五百多則。我們對希拉蕊的貼文進行情緒分析,發現了一件有趣的事—在希拉蕊宣告參選之前,川普對她的態度可以說是基本保持正向的。 以下三張圖分別是2014年至2016年希拉蕊貼文的情緒分析。可以看到風向在2015年4月12日,也就是希拉蕊正式宣布參選的那天開始亂掉,而且越來越亂。












那麼選舉過後呢?
我們發現川普是個記仇的人。以下是2016年至現在,歐巴馬、希拉蕊的推特貼文數的變化,並加入中國作為比對。可以發現總統大選後,希拉蕊的貼文數雖然往下掉,但三者大致上都在一百多則左右。川普對希拉蕊的態度,從一開始2014年的個位數則,到現在就算總統大選結束,仍然每年都有穩定一百多則,可見川普這人挺記仇的。










那麼川普對他的敵人都是負面的抨擊嗎? 以下是對歐巴馬貼文2020年的情緒分析。其實好像不完全都是負面言論。不過實際拿幾篇貼文來看,會發現獲得正面情緒分數的貼文大都是” Now that the economy is doing well again Obama will be taking credit for it.” 之類,拿敵人的名字來稱讚自己的形式。











川普和歐巴馬的推特影響力



X軸為時間
Y軸為Polarity
Engagement為影響力

我們設計的Engagement計算方式:

Engagement = Normalize (按讚數 + 轉發數*2)

泡泡越大表示這則推特影響力越大
我們可以從下表看出Polarity和Engagement之間的關係。
Top